{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
- Fenix
- Администратор
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
wasyaka писал(а): May 20 2018
В сборках подключены и активированы словари для голосового синтезатора IVONA Maxim & Tatyana (синтезатор в сборку не входит)
Звучание в целом удовлетворительное.
Выявленные ошибки и вопросы задаём здесь. Ошибки в произношении слов присылайте в составе целого предложения по шаблону.
Слово: Это слово в составе предложения.
С использованием программы Balabolka► Показать► Показать► ПоказатьПортабельная версия Balabolka с включёнными и настроенными словарями для обработки и последущей прослушки - записи.► Показать
Правая кнопка мышки по окну словарей. В выпадающем меню Профили выбираем нужное действие:Новые слова(21.05)
- Полный - Обработка всеми словарями Ctrl+T
- Без Ё - Обработка словарями текстов с проставленным ё Ctrl+T
- Обработка омографов для ручного пополнения словарей Ctrl+T
- Чтение обработанного текста F5
► Показать
Демагог одной кнопкой от пользователя tonio_k► Показать► ПоказатьИнструкция:► Показать
- Открываем файл с книгой
- Нажмаем Ctrl+F2
- В открывшемся окне запускаем
00_ПЕРВИЧНАЯ ОБРАБОТКА.lua- Дожидаемся информационного окна о завершении подготовки книги
- Можно приступать к чтению вслух или записи в mp3
Необходимо установить синтезатор голоса IVONA Maxim! Словари ориентированы исключительно на него.
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
я бы вам рекомендовал перевести словарь 1.3. corector омо.rex в формат DIC. Скорость обработки текста увеличится в разы! А результат будет тот же.
Посмотрите как выглядит ваш словарь в формате DIC:
► Показать
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Пример:
- Варвары съели Валю
В rex
- варвары съели вАлю
В dic
- варвАры съели вАлю
Это на вскидку - я пытался раньше в dic но из-за различных ошибок (уже все и не помню)
Тише едеш...
И в данный период я не использую Demagog.
Просто словари из BXD переконвертировал в REX и DIC за исключением Ё(поленился - звёзды - доп движения и не актуально...)
- good_cat
- Администратор
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
wasyaka, в словари DIC прокрались "ашипки":
Код: Выделить всё
авариях=<phoneme ph="ɐv'a rʲijəx"/"/>
адекватностями=<phoneme=<phoneme ph=""/>
карги=<phoneme ph="kɐrɡʲˈi>"/>
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
согласен поспешил
Тогда такой вариант (гибрид) - скорость так же - в разы выше (для эксперимента еще в BXD объеденил
► Показать
Отправлено спустя 13 минут 31 секунду:
а что не так? ударение на "И"
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Можно и так, но лично для меня скорость обработки не актуальна.
Я пока слушаю главу 1 успеваю обработать главу 2 - выбираю не обработанные омографы те на которые нужно проставить ударение добавляю в словарь 1.5. homographs.bxd и обрабатываю этим словарём. ошибки словарей также правлю.
i>"/>
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
wasyaka, ошибка?
@([А-яЁё])\, \сомов\b=$1, сомОв
@([А-яЁё])\, \соколов\b=$1, сОколов
@([А-яЁё])\, \сомов\b=$1, сомОв
@([А-яЁё])\, \соколов\b=$1, сОколов
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
wasyaka, Прижимая мокрый платочек к распухшему носу.
- добавить |шему
почему не срабатывает?
Код: Выделить всё
(\w+(дав|ому|ьему)\b\s?(\w+)?)\s{1,4}(\bносу\b)=$1 нОсу
Код: Выделить всё
(\b(и|из|к|к [егоёих]{1,3}|по)\s?(\w+)?)\s{1,4}(\bносу\b)=$1 нОсу
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Чтоб сработало доп слово \s?(\w+)?
надо в строку добавить слово из не менее восьми символов (почему? - это как давай покрасим холодильник в чёрный цвет )
Код: Выделить всё
(\b(аааааааа|и|из|к|к [егоёих]{1,3}|по)\s?(\w+)?)\s{1,4}(\bносу\b)=$1 нОсу
Код: Выделить всё
\b(и|из|к|к [егоёих]{1,3}|по)\s{1,4}(\bносу\b)=$1 нОсу
- MoppoH
- Обыватель
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
давно хотел спросить, почему вы в рег выражениях ставить \s обозначающий пробел, не проще просто пробел поставить, и еще ? после него, если пробел один, то ? и не нужен
(\b(и|из|к|к [егоёих]{1,3}|по) (\w+)) {1,4}\bносу\b=$1 нОсу
такое выражение не сработает?
(\b(и|из|к|к [егоёих]{1,3}|по) (\w+)) {1,4}\bносу\b=$1 нОсу
такое выражение не сработает?
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
MoppoH ваш (\b(и|из|к|к [егоёих]{1,3}|по) (\w+)) {1,4}\bносу\b=$1 нОсу у меня срабатывает. Без {1,4} - тоже. Но я сталкивался с тем, что пробелы иногда почему то не срабатывают. Меняю на \s и сразу реакция есть. А вообще, правило, где вместо пробела стоит \s более читаемое - в смысле сразу понятно, что тут пробел, а не глюки после долгого просмотра кода, где не понятно пробел это или скобки стоят далеко друг от друга. "Наглядность" напрямую зависит от выбранного шрифта и его размера.
Вообще, мне больше нравятся правила такого очень простого шаблона:
#((\bslovo\b|\bslovo\b)[^\.,!?-]{0,20})(\bzamena\b)=$1ZAMENA
#(\bzamena\b)([^\.,!?-]{0,20}(\bslovo\b|\bslovo\b))=ZAMENA$2
по этому шаблону пример будет так выглядеть:
(\b(и|из|к|к [егоёих]{1,3}|по)\b[^\.,!?-]{0,10})(\bносу\b)=$1нОсу
, где 10 (символов) - примерно одно слово "между" slovo и zamena
оно конечно не самый лучший вариант, но по мне - самый простой и легкий. Убирая из правила запятую или точку- тем самым допускаем её присутствие или, даже, захват соседнего предложения. Тогда становиться очень похоже на звездочки в DIC у Демагога, но эта широта как раз и не очень устраивает меня лично - слишком "широко" читается правило. Так что максимум - это убрать запятую.
Вообще, мне больше нравятся правила такого очень простого шаблона:
#((\bslovo\b|\bslovo\b)[^\.,!?-]{0,20})(\bzamena\b)=$1ZAMENA
#(\bzamena\b)([^\.,!?-]{0,20}(\bslovo\b|\bslovo\b))=ZAMENA$2
по этому шаблону пример будет так выглядеть:
(\b(и|из|к|к [егоёих]{1,3}|по)\b[^\.,!?-]{0,10})(\bносу\b)=$1нОсу
, где 10 (символов) - примерно одно слово "между" slovo и zamena
оно конечно не самый лучший вариант, но по мне - самый простой и легкий. Убирая из правила запятую или точку- тем самым допускаем её присутствие или, даже, захват соседнего предложения. Тогда становиться очень похоже на звездочки в DIC у Демагога, но эта широта как раз и не очень устраивает меня лично - слишком "широко" читается правило. Так что максимум - это убрать запятую.
- MoppoH
- Обыватель
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
просто когда смотрю ваши варианты рег выражений, в них очень много разных якорей и символьных классов, которые в принципе не очень и нужны в них, конечно каждый выбирает как ему удобно, и не знаю почему в разных программах рег выражения работают по разному, а то можно сделать типа вот такого выражения, которое сразу заменяет очень многое
(?i)(?<=\b(край|нить|(глубин|куск|кусоч|облом[ок]|половин|правил|середин|сторон|тяжест|удар|участ|центр)\w{0,3}|част(и|ь|ью|ях))\b.)\b(бедра|гнезда|головы|души|дыры|доски|земли|игры|копья|лица|ноги|плиты|пятна|реки|руки|скалы|стены|страны|стрелы|судьбы|травы|тропы|щеки)\b=$+<
(?i)(?<=\b(край|нить|(глубин|куск|кусоч|облом[ок]|половин|правил|середин|сторон|тяжест|удар|участ|центр)\w{0,3}|част(и|ь|ью|ях))\b.)\b(бедра|гнезда|головы|души|дыры|доски|земли|игры|копья|лица|ноги|плиты|пятна|реки|руки|скалы|стены|страны|стрелы|судьбы|травы|тропы|щеки)\b=$+<
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Ваш вариант под Максима или Николая?
Не спорю хитро сделано в итоге знак "< " на последнюю букву для каждого слова на конце, что для Николая - самое то, а вот для Максима - не подходит. Придется последней набор слов разбивать на соответствующее количество строк с правилами - под каждое слово с ударением. И 99% всех правил rex это наработки только от waska причем он эти правила (тысячи их) переносил из KoobAudio и подгонял под требования к rex в Балаболке. Создавались эти правила не один год. Думаю своё отношение к rex waska до сих пор меняет и оптимизирует. Только такой огромный массив уже не перелопатить. Что то вылезет - он корректирует, а в основном работает очень хорошо потому и корректировки в самих rex не так часты.
Если вас заинтересовала эта сборка под Максима, то, думаю, waska ваши предложения по корректировке и оптимизации правил rex обязательно примет на вооружение и внесёт изменения в существующий словарь
Не спорю хитро сделано в итоге знак "< " на последнюю букву для каждого слова на конце, что для Николая - самое то, а вот для Максима - не подходит. Придется последней набор слов разбивать на соответствующее количество строк с правилами - под каждое слово с ударением. И 99% всех правил rex это наработки только от waska причем он эти правила (тысячи их) переносил из KoobAudio и подгонял под требования к rex в Балаболке. Создавались эти правила не один год. Думаю своё отношение к rex waska до сих пор меняет и оптимизирует. Только такой огромный массив уже не перелопатить. Что то вылезет - он корректирует, а в основном работает очень хорошо потому и корректировки в самих rex не так часты.
Если вас заинтересовала эта сборка под Максима, то, думаю, waska ваши предложения по корректировке и оптимизации правил rex обязательно примет на вооружение и внесёт изменения в существующий словарь
- Большой Ух
- Наблюдатель
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
доброго вам здоровица,спасибо ,
только вот при соханении аудио в балаболке ,при использовании движка ивона максим, программа вылетает,именно на максиме, милена и татьяна спокойно сохраняют аудио.
помогите разобраться
только вот при соханении аудио в балаболке ,при использовании движка ивона максим, программа вылетает,именно на максиме, милена и татьяна спокойно сохраняют аудио.
помогите разобраться
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
\s?(\w+)? -? означает может присутствовать, а может и нет, при вашем варианте к носу не сработает
( \s(\w+)?){1,}) - используется всё предложение (пропущенные(не использованные для правила) слова до ключевого заменяются пробелом) и это грубое правило, ниже(далее) по словарю более точные и т.д. отсюда и \s{1,4}, в отличии от KoobAudio где срабатывание на "первом встречном" и как бы наизнанку от точного к размытому .Из-за этого я и отказался от проги и перешёл на REX.
[^\.,!?-]{0,10} - а почему 10, а не11?
(\b(блабла)(\w+)?([…,.!?:;])?(\s(\w+)?){1,})(\bугу\b)=$1 угУ
или
(\b(блабла)(\w+)?(\s(\w+)?([….!,?:;])?){1,})(\bугу\b)=$1 угУ
или
(\b(блабла)(\w+)?([….!,?:;])?(\s(\w+)?([….!,?:;])?){1,})(\bугу\b)=$1 угУ
И каждый выбирает по себе...
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
- кроме переустановки Движков - ничего в голову не приходит
- в среднем длина слова в русском языке - 7 символов. 10 - это я с расчетом на "чуть выше средней" длины слова. Хотя все же в одно слово лучше сразу заложить 15 символов в правило. А вот если предполагать в правиле больше одного слова, то тогда по 10 символов на каждое слово должно быть достаточно. Если в предложении между словами нет запятых, (и это предусмотрено правилом) то можно и более "жадно" количество символов заложить. Чисто теоретически (среднестатистически), если нет запятых между найденными словами, значит нет смысловых отсылок одной части предложения к другой его части. И все прилагательные и глаголы по смыслу принадлежат одному единственному существительному. Здесь можно хоть 1000 символов заложить.
- balabolka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Самая первая версия IVONA Maxim работала с ошибками, поэтому голос "вылетал" при чтении некоторых предложений. Скачайте и установите последнюю версию голоса "Максим" (кажется, это версия 1.6.76): она будет работать стабильно.Большой Ух писал(а): ↑24 июл 2018 06:20только вот при соханении аудио в балаболке ,при использовании движка ивона максим, программа вылетает,именно на максиме
- Arex
- Интересующийся
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Вопрос по сборке.
Я хочу уточнить, все эти словари будут работать только в Балаболке? Или если я подключу TTS где-нибудь ещё, например в ICE Book Reader, они тоже будут работать?
Например, если тире стоит в начале строки (в диалоге), то после него ставится неразрывный пробел, а в остальных случаях в книгах перед тире ставится неразрывный пробел, а после него - обычный.
Я хочу уточнить, все эти словари будут работать только в Балаболке? Или если я подключу TTS где-нибудь ещё, например в ICE Book Reader, они тоже будут работать?
Скорее всего, это потому что в тексте, помимо обычных пробелов, встречаются ещё и неразрывные пробелы. Выглядят они так же, но кодируются другим символом и по ним слова не переносятся на другую стороку.
Например, если тире стоит в начале строки (в диалоге), то после него ставится неразрывный пробел, а в остальных случаях в книгах перед тире ставится неразрывный пробел, а после него - обычный.
Ещё бы знать, где эту версию узнать. У меня установлена Hapro Speech2Go с пакетами голосов от Ivona и Nuance. И по Максиму удалось узнать лишь, что это IVONA 2 Maxim OEM.
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Посмотрите на форуме ссылка на официальный сайт с лайфхаком
Для начала удалите то что у вас уже установлено для снижения вероятности конфликтов.
На счёт словарей: сборки включают словари, которые уже не совместимы между Балаболкой и Демагогом. Точнее словари от демагога ещё можно применить в Балаболке, но не наоборот.
(А надо бы поднять эту тему)
Что бы было понятно, словари это сборник правил замен в самом тексте. Т.е. если вы произведете замены в тексте в Демагог или Балаболке, то полученный текст IVONA Maxim будет читать уже в любой читалке. Но этот текст визуально выглядет местами "крякобразно" и не красиво. Так что лучше ограничеться Балаболкой или Демагогом
► Показать
Для начала удалите то что у вас уже установлено для снижения вероятности конфликтов.
На счёт словарей: сборки включают словари, которые уже не совместимы между Балаболкой и Демагогом. Точнее словари от демагога ещё можно применить в Балаболке, но не наоборот.
(А надо бы поднять эту тему)
Что бы было понятно, словари это сборник правил замен в самом тексте. Т.е. если вы произведете замены в тексте в Демагог или Балаболке, то полученный текст IVONA Maxim будет читать уже в любой читалке. Но этот текст визуально выглядет местами "крякобразно" и не красиво. Так что лучше ограничеться Балаболкой или Демагогом
- Arex
- Интересующийся
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
tonio_k, намного понятнее не стало. Насколько я разобрался, в сборки входят Балаболка или Демагог с набором словарей к ним. Эти словари по действию заменяют/дополняют лексикон, то есть выдают текст в родном формате для TTS-движка. Так?
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Возможно я не до конца понимаю что вы Включаете в понятие"лексикон". Может мы говорим об одном и том же)))
Максим по умолчанию сам по себе неплохо читает. Многих и это устраивает.
Как вы прочитаете:
"Нам любые дороги дороги"
Движок прочитает только либо дорОги дорОги или дОроги дОроги
Задача словарей:
1) правильно заменить в нужных местах дороги на дОроги или дорОги
2) неизвестное Максиму слово дОроги перевести в родное Максиму < dOOrogi> *
*dOOrogi - условный и далёкий от реальности пример. Пишу со смартфона, словарей под рукой нет
Вот поэтому после Балаболки текст на 70% обычный (Максим и так их хорошо читает), остальное- родные для максима крякобразы. Что бы увидеть, что получаем на выходе, в Демагог или Балаболке при включенных словарях нажмите "показать измененный текст"
Отправлено спустя 4 часа 47 минут 41 секунду:
+ Обновлен Демагог до Version 7.29.352
+ Добавлен скрипт: 70_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ
Если у вас несколько томов одной книги, скрипт позволяет склеить все эти тома в одну книгу. Это удобно если есть желание обработать все книги разом как одну. В конце каждого тома происходит автоматическая вставка номера тома по порядку.
+ Из за частых ложных срабатываний 10_REX_стандартные замены+все-всЁ.rex разбит на два файла: 1) 10_REX_стандартные замены.rex и 2) _vse_vsyo.rex
При этом, _vse_vsyo.rex по умолчанию отключен. Включать имеет смысл только если в тексте не встречаются слова "всё" с буквой Ё
Максим по умолчанию сам по себе неплохо читает. Многих и это устраивает.
Как вы прочитаете:
"Нам любые дороги дороги"
Движок прочитает только либо дорОги дорОги или дОроги дОроги
Задача словарей:
1) правильно заменить в нужных местах дороги на дОроги или дорОги
2) неизвестное Максиму слово дОроги перевести в родное Максиму < dOOrogi> *
*dOOrogi - условный и далёкий от реальности пример. Пишу со смартфона, словарей под рукой нет
Вот поэтому после Балаболки текст на 70% обычный (Максим и так их хорошо читает), остальное- родные для максима крякобразы. Что бы увидеть, что получаем на выходе, в Демагог или Балаболке при включенных словарях нажмите "показать измененный текст"
Отправлено спустя 4 часа 47 минут 41 секунду:
+ Обновлен Демагог до Version 7.29.352
+ Добавлен скрипт: 70_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ
Если у вас несколько томов одной книги, скрипт позволяет склеить все эти тома в одну книгу. Это удобно если есть желание обработать все книги разом как одну. В конце каждого тома происходит автоматическая вставка номера тома по порядку.
+ Из за частых ложных срабатываний 10_REX_стандартные замены+все-всЁ.rex разбит на два файла: 1) 10_REX_стандартные замены.rex и 2) _vse_vsyo.rex
При этом, _vse_vsyo.rex по умолчанию отключен. Включать имеет смысл только если в тексте не встречаются слова "всё" с буквой Ё
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
► Показать
И где кряки с зябрами?
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
как бы вот...
► Показать
Под кряки с зябрами я подразумевал понятный для Максима но не понятный для обычного человека фонемы типа <phoneme ph="stˈorɐnʊ"/>. - они то и кажутся крякобразами для непосвященных2) неизвестное Максиму слово дОроги перевести в родное Максиму < dOOrogi> *
*dOOrogi - условный и далёкий от реальности пример. Пишу со смартфона, словарей под рукой нет
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
У меня два словаря: один в pls - читалка Homograph, второй в dic- читалка Balabolka - но нигде не использую замену текста на фонемы. на лету пережовывают...
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Ну, а у меня всё в одном. "Одной кнопкой" так сказать. Да и в процессе записи в mp3 или чтения вслух, эти крякобразы и не видны пользователю. Всё происходит "на лету". Виден только исходный текст книги. Про крякобразы я привел пример только что бы ответить на вопрос выше.
- Arex
- Интересующийся
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
tonio_k, Спасибо за пояснения, значит я правильно понял.
Отправлено спустя 7 часов 21 минуту 52 секунды:
Где-то я тут видел программу, кажется, Транскриптор, так у неё результат работы был похожий. Но я думал, что это только для Алёны...
Отправлено спустя 7 часов 21 минуту 52 секунды:
Кстати, а откуда они берутся? Где можно об этм почитать? Не вручную же по буковке записываются.
Где-то я тут видел программу, кажется, Транскриптор, так у неё результат работы был похожий. Но я думал, что это только для Алёны...
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
OpenPLS. Редактор PLS-словарей для IVONA TTS
► Показать
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Отсортировал по длине строки
► Показать
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
(\bконц)\s?(лагеря\b)=$1$2 -это из
чтоб слитно...
0.575 версия Балаболки показывает время потраченное правилами - на первый взгляд: самый тормоз
(\w+(|)\b\s?(\w+)?)\s{1,4}(\b\b)=$1 сработка по окончаниям. При удалении \s?(\w+)?) на
децел меньше
(в|л|т) заменить на [влт] круглые на квадратные- прилично ускоряет .
надо смотреть... если смысл...
Извини - сейчас футбол - потом баиньки - прошлые сутки - на хлебушек с... работал
Код: Выделить всё
(\b(администраци|атак|вместо|внутрь|вокруг|враждебных|враждующих|второго|границ|дартарского|двор|заключённы[ех]|западнее их|захвате|защитников|иотийского|канцелярия|картотека|комендант|конец|край|курсант|местного|мимо их|напротив|начальник|начальству|ночного|обитатели|обход|окраине|охран[енмауой]{1,3}|периметр|персонал|план|площадь|полевого|посреди|постановк|пределами|пределы|приверженцы|разбивк|регламентом|сворачиванию|середин|серёдке|снятие|состав|стенами|сторон|страшного|схема|территорию|типичного|треть|уголок|узник|устройство|участки|хозяев|центр|центре|части|часть|штаб|штурм)(\w+)?(\s(\w+)?){1,})(\bконц)?(лагеря\b)=$1 $6лАгеря
0.575 версия Балаболки показывает время потраченное правилами - на первый взгляд: самый тормоз
(\w+(|)\b\s?(\w+)?)\s{1,4}(\b\b)=$1 сработка по окончаниям. При удалении \s?(\w+)?) на
децел меньше
(в|л|т) заменить на [влт] круглые на квадратные- прилично ускоряет .
надо смотреть... если смысл...
Извини - сейчас футбол - потом баиньки - прошлые сутки - на хлебушек с... работал
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Чисто эксперимента ради попробуй все \s заменить на пробел. Не сегодня, конечно
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Такая мысль, словарь REX имеет множество ненужных строк, или строк, которые можно сократить за счет оптимизации в словаря[ фонем.
Например слова: "пола" и "адреса" - имеют только 2 варианта ударений.
По умолчанию Максим читает пОла и адресА
В словаре rex присутствуют "принудительные" замены: полА , Адреса
Следовательно все правила в rex, в которых есть исправления на пОла и адресА - лишние
Для надежности, можно в словаре фонем прописать $пола = <pOla>; $адреса = <adresA>
- c учетом регистра (что бы ранее сделанные исправления пОла и адресА не были подтерты
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Ответил на ветке Балаболки...
Это когда проставляеш вручную, чтоб сократить список...
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
► Показать
Отправлено спустя 2 дня 12 часов 36 минут 41 секунду:
05.11.2018
+Demagog Version 7.29.359
+Добавление правил в словари
+Изменение алгоритма записи в аудио в скрипте 51_ЗАПИСАТЬ В MP3.lua - обработка текста быстрее (на 10%-20%). 00_ПЕРВИЧНАЯ ОБРАБОТКА включена в работу скрипта
+Добавлена инструкция к ускоренному методу записи в MP3
Отправлено спустя 18 часов 39 минут 12 секунд:
задай фильтр в балаболке:
Неактивно
Регулярные
ПроизноситьКак ё думаю лучше и восстановить все слова где идет замена е на ё
- GIS88
- Обыватель
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
1. Чтобы перенести ваши настройки в новую версию программы Balabolka достаточно перенести папку dictionaries или надо что то еще?
2. У меня правильно подключены словари или надо подключить все .bxd словари ?
https://cdn1.savepice.ru/uploads/2018/1 ... c-full.jpg
2. У меня правильно подключены словари или надо подключить все .bxd словари ?
https://cdn1.savepice.ru/uploads/2018/1 ... c-full.jpg
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
15.11.2018
+Demagog Version 7.29.360
+Оптимизация правил в словарях
+51_ЗАПИСАТЬ В MP3.lua переименован в 10_ОКНО - ЗАПИСАТЬ В MP3
+Изменение алгоритма записи в аудио в скрипте 10_ОКНО - ЗАПИСАТЬ В MP3.lua
+Добавлен скрипт 20_ПАКЕТНАЯ ЗАПИСЬ ВСЕХ КНИГ В ПАПКЕ
+70_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ переименован в 30_СКЛЕИТЬ НЕСКОЛЬКО КНИГ В ОДНУ
+Добавлен скрипт .==============ЭКСТРЕННОЕ ЗАКРЫТИЕ ДЕМАГОГ============= -Что бы выйти из программы Демагог не дожидаясь завершения записи книги
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
bxd подключаются для обработки текста - галки на них и ctrl+T, после обработки открыть в новой вкладке и сохранить, дальше как на фото - это для прослушки - записи.
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
wasyaka, интересный момент по целесообразности разбиения большого (по количеству символов) REX правила на два.
Например два правила:
эти же два правила, но объединенные в одно:
по времени особой разницы между ними нет.
Но все же объединение дает небольшой плюс к скорости обработки:
Два правила: 11,2 с.
Два в одном: 10,6 с.
Отправлено спустя 5 дней 6 часов 49 минут 31 секунду:
17.12.2018
+Demagog Version 7.29.362
+Оптимизация правил в словарях
+в сборку добавлен сторонний кодек ffmpeg.exe
В Демагоге в настройках аудиоконвертора в строке с параметрами можно поменять:
atempo=1.1 - ускорение/замедление чтения (=1.0 - стандартная скорость)
64k - степень сжатия
-+ переименован скрипт ЭКСТРЕННОЕ ЗАКРЫТИЕ ДЕМАГОГ в CtrlQuit. Теперь его можно запустить в любом окне комбинацией клавиш Ctrl+Shift+9
+ 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua Теперь скрипт можно запустить для текущего окна комбинацией Ctrl+Shift+1
+ Добавлен скрипт 40_ПРОДОЛЖИТЬ ЗАПИСЬ СЕРИАЛА В ПАПКЕ - продолжает запись с прерванного места из папки с файлами сериала
Например два правила:
► Показать
► Показать
Но все же объединение дает небольшой плюс к скорости обработки:
Два правила: 11,2 с.
Два в одном: 10,6 с.
Отправлено спустя 5 дней 6 часов 49 минут 31 секунду:
17.12.2018
+Demagog Version 7.29.362
+Оптимизация правил в словарях
+в сборку добавлен сторонний кодек ffmpeg.exe
В Демагоге в настройках аудиоконвертора в строке с параметрами можно поменять:
atempo=1.1 - ускорение/замедление чтения (=1.0 - стандартная скорость)
64k - степень сжатия
-+ переименован скрипт ЭКСТРЕННОЕ ЗАКРЫТИЕ ДЕМАГОГ в CtrlQuit. Теперь его можно запустить в любом окне комбинацией клавиш Ctrl+Shift+9
+ 00_ПЕРВИЧНАЯ ОБРАБОТКА.lua Теперь скрипт можно запустить для текущего окна комбинацией Ctrl+Shift+1
+ Добавлен скрипт 40_ПРОДОЛЖИТЬ ЗАПИСЬ СЕРИАЛА В ПАПКЕ - продолжает запись с прерванного места из папки с файлами сериала
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Немножко информации...
Самые медленные правила:
(\w+(|)\b\s?(\w+)?)\s{1,4}(\b\b)=$1
(\b\b)(\s?(\w+)?\s{1,4}(\w+(|)\b))= $2
которые я удалил, переделал в (пример из словаря)
Код: Выделить всё
@(\w+(авят|ает|аешь|азал|айте|аны|анял|ать|ашел|мают|ая|вая|мая|рая|чая|вали|мали|рали|хали|ашли|взял|вшим|даем|етны|ечал|знал|знаю|зови)\b)\s{1,4}(\bместа\b)=$1 местА
@(\bместа\b)\s{1,4}(\w+(ают|лить|удут|(ж|к|х|ш|щ)ие|ые|ятся)\b)=местА $2
Словарик самый последний, то что не смогли основные...
На тхт файле в пол метра дало 17 срабатываний и из них 3 дважды - 20 фраз с омографом в плюс
Хороший результат. но...
в BXD + 30минут
в REX (Демагог) + 11минут
в DIC (KooBAudio )- около минуты...
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
а результаты срабатывания идентичные? Срабатывают все подходящие правила или только первое подходящее?
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
В проге используется 1 словарь - так сказать "полировка" (извлёк подходящие из 06 регулярные выражения у MoppoH) и одно (два если окончание после омографа) правило, Специально сверку не делал.
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Вообще, KooBAudio у меня на старом ноутбуке ЦП грузит на 90-100% и держит нагрузку на время обработки всей книги. В таком режиме мой ноут отключается через час от перегрева. Это была одна из первых причин отказа от KooBAudio. Однако только загрузкой процессора скоростью в 11 раз быстрее чем в Демагоге не обьяснить... Тут только гипотезы строить. Все равно автора KooBAudio не найти что бы секретом поделился
- balabolka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Никакого секрета нет: KooBAudio написан на .NET Framework и использует классы из пространства имен System.Text.RegularExpressions. Это совсем другая платформа, и что касается обработки регулярных выражений - очевидно, там она реализована лучше.
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
wasyaka, в словарях dic нашел много правил подходящих под шаблон:
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
пример:
Убрал все правила (их оказалось довольно много) подходящие под эти шаблоны и заменил на выше указанные три правила со звездочкой, но вот теперь думаю, а не поспешил ли?
Может есть примеры, которые подходят под:
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
но ударение должно быть глазА?
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
пример:
► Показать
Может есть примеры, которые подходят под:
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
но ударение должно быть глазА?
- wasyaka
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
у (больных|бритоголовых|иных|неруских|рядовых) глазА закосили
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
а если так?
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
у *ких глаза=у ких глазА
у *ных глаза=у ных глазА
у *вых глаза=у ных глазА
*ких глаза=ких глАза
*ных глаза=ных глАза
*вых глаза=ных глАза
у *ких глаза=у ких глазА
у *ных глаза=у ных глазА
у *вых глаза=у ных глазА
- SAMERS
- Постоялец
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Здравствуйте.
Скачал вашу сборку Балаболки.
Загрузил книгу.
Книга весит 1.5 Мб
Профиль выбрал Полный - Обработка всеми словарями Ctrl+T
Обработка около часа длилась.
Затем нажал открыть новый документ.
Затем сохранить как несколько аудиофайлов.
И... Прошло уже 5 часов. Озвучено пока 98%.
Я в шоке от такой скорости.
Что я сделал не так?
Раньше была Балаболка с какими то словарями, ошибок конечно много было в произношении НО за 6 часов я не торопясь мог озвучить 6 книг такого размера а тут одна никак не озвучится.
Скачал вашу сборку Балаболки.
Загрузил книгу.
Книга весит 1.5 Мб
Профиль выбрал Полный - Обработка всеми словарями Ctrl+T
Обработка около часа длилась.
Затем нажал открыть новый документ.
Затем сохранить как несколько аудиофайлов.
И... Прошло уже 5 часов. Озвучено пока 98%.
Я в шоке от такой скорости.
Что я сделал не так?
Раньше была Балаболка с какими то словарями, ошибок конечно много было в произношении НО за 6 часов я не торопясь мог озвучить 6 книг такого размера а тут одна никак не озвучится.
- tonio_k
- V.I.P.
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Есть предложение, что при записи в аудио у вас активированы галочками словари. В результате при записи в аудио ранее обработанного текста у вас опять текст обрабатывает активными словарями и только после этого начинается запись в аудио.
- SAMERS
- Постоялец
{IVONA} Всё включено. Готовые сборки для чтения/записи книг.
Ваше предположение верно. Честно сказать не в курсе был что надо их выключать.
Спасибо за подсказку.
Может есть новая сборка?